sre

コンテナイメージのタグをよしなに探すツールを作りました

SRE チームの市川恭佑です。 今回はコンテナに関連するDevOpsツールを作った話です。ecresolve と書いて「イーシーリゾルブ」と読みます*1。 github.com ecresolve は、ざっくり言うとコンテナイメージのタグが上書きされる前提で、複数タグを指定すると一番…

カヤックのSREチームは「SREに関することなら何に使ってもいい時間」がある

sre

SREsがSREのために自由に使える人事リソースのはなしです。

CEL(Common Expression Language)を使ってIAMポリシーを検索する iam-policy-finder

sre

SREチームの藤原です。 今回は CEL(Common Expression Language) を使って、AWSのIAMポリシーを検索するツールを作ったので紹介します。 github.com 3行でまとめ CEL (Common Expression Language)の式を指定してAWS IAMポリシーを検索するツールをOSSとして…

AWS Systems Manager Parameter Storeを便利に使うツール "ssmwrap" がv2になりました

AWS Systems Manager Parameter Storeを便利に使うツール "ssmwrap" がメジャーバージョンアップしv2になりました。 本記事ではv2にバージョンが上がることになった経緯や、v1からの移行方法などについて紹介しています。

AWSコスト異常検知を導入したら、『人にお願いする』トイルが発生したのでSlackBotを作って解消した

sre

SREチームの池田(@mashiike)です。SRE連載の5月号になります。 AWSのコストについては、多くの方がすごく気にしていると思います。 カヤックでもAWSのコストの変動に関しては敏感に気にしています。 そんな方々の心のお供になる機能が、 AWSコスト異常検知(…

Fargate Spotを本番運用するための監視の実践

sre

SREチームの橋本です。SRE連載の3月号となります。 Amazon ECSのコスト最適化においてはFargate Spotが有効な手段となりますが、いつ中断されるか分からない性質上、その監視も併せて実施していく必要があります。今回はそのFargate Spotを本番環境で運用し…

Ruby 3.3でのアップデートも要チェック!まちのコインでYJITを有効化したはなし

カヤックが開発・運用している地域通貨サービス「まちのコイン」は、Ruby on Railsを使用しています。 このまちのコインにてYJITを有効化し、その結果どのような影響があったのかを紹介します。

CloudFront FunctionsをテストするOSS、cfftを公開しました

SREチームの藤原です。 今回は Amazon CloudFront Functions をテストするためのOSSとして、cfft というものを書いたので紹介します。 github.com 3行でまとめ CloudFront Functionsのテストは手元ではできなくて面倒です CloudFront Functionsをテストする …

デプロイ対象環境ごとに別々のSlackチャンネルに通知するGitHub Actionsの実装例

デプロイを実行するGitHub Actionsの実行状況を デプロイ対象環境ごとに別々のSlackチャンネルに通知する場合の実装例として、 「slackapi/slack-github-actionで通知をつくりこむ」 「Actions Workflowを分ける」 「Actions Workflow実行の入り口を分ける」…

実践的なPrepalertの設定

この記事はMackerel Advent Calendar 2023 の22日目です。 こんにちは、SREチーム所属の@mashiikeです。 先日の、Mackerel Meetup #15 Tokyo ではパネルディスカッションでパネリストの一人として参加させていただきました。とても楽しかったです。ありがと…

dbtでCIを実現するために、Github ActionsでAWSのVPC越えしたい。

この記事はTech KAYAC Advent Calendar 2023の8日目の記事です。 こんにちわ。その他事業部SREチームの@mashiikeです。 最近、風変わりな記事を連投しているのですが、今回も風変わりです。 ひとことで要約すると、 私は!Github Actionsから!Redshiftにア…

GitHub ActionsでEnvironmentsを使わずにManual approvalを実装する

SREの今です。 CircleCIやGitHub Actions等のCI/CDツールでデプロイの自動化に取り組む際に、意図しない本番反映の防止策として承認アクション(Manual approval)を挟んでおくことがあります。 GitHub Actionsでは、Environmentsを利用することでワークフロー…

AWS Lambda のアクセス許可を紐解く

sre

SREチームの橋本です。SRE連載の11月号になります。 AWSの多くのリソースはIAMでアクセスを一元管理されていますが、Lambdaではユーザーが実行したり他のAWSサービスから実行されたりする都合上、様々なポリシーが絡んでいます。 特に「Lambdaを呼び出す許可…

Zero-ETL integrationの実用を試みた。 しかし、Aurora MySQLの中身の〇〇が多すぎて失敗した。

sre

SREチームの池田です。この記事は、早速Zero-ETL integrationの実戦投入を試してみたという内容です。なお、この記事は失敗事例になりますが、Zero-ETL integrationはとても素晴らしい機能ですので、皆様も是非お使いください。

Google Cloud Operations Suite で実現する "頑張らないオブザーバビリティ"

SRE チームの市川恭佑です。 先日、CloudNative Days Tokyo 2023 のプロポーザルを提出したのですが、残念ながら採択に至らなかったので、今回は宇宙最速の(?)供養エントリになります。 シェア・投票など、ご応援をくださった皆様にはこの場でお礼を申し…

タスクランナーとしてのmakeを使う際の工夫と注意点

sre

make をタスクランナーとして利用する例を紹介します。 タスク定義を共通化する工夫の他に、make を多用した場合の注意点についても触れます。

10/19(木)開催の「AWS for Games Live: これからのゲームデータ分析環境を考える」にSREの池田が登壇します!

「Amazon Aurora MySQL と Amazon Redshift の Zero-ETL Integration について使い所を考えてみた!」というタイトルでカヤックの池田がおはなしをさせていただきます。

OSS 『Prepalert』 の紹介

SRE

SREチームの池田です。この記事が出ている頃には私はSRE Next 2023に参加しているでしょう。私のセッションは『Warningアラートを放置しない!アラート駆動でログやメトリックを自動収集する仕組みによる恩恵』です。このセッション中で話す仕組みはOSS『Pre…

9/29(金)開催のSRE NEXT 2023 IN TOKYOにカヤックSREの池田が登壇します!

SRE NEXT 2023 IN TOKYOにカヤックSREチームの池田が登壇します。 トイルになりがちなWarningアラートの対応改善についてはなします。

常時稼働が不要なRDSインスタンスを停止してAWS料金を節約する

Amazon RDSを7日間以上停止し続けるための仕組みを紹介します。使用していない期間はRDSインスタンスを停止することで、無駄な課金を削減します。

CloudWatch Logs Insights クエリを定期的に実行して結果をS3に置く(EventBridge Scheduler, Step Functions, Lambda)

カヤックSREの今です。SRE連載8月のエントリーになります。 今回は自動で日時の集計クエリをAmazon CloudWatch Logs Insightsで実行し、結果をAmazon S3に保存する例をご紹介します。

カスタマイズで広がるAWS Copilotの実践力

sre

AWS Copilotの内部ではCloudFormationを使っていますが、最近のアップデートで大幅にCFnテンプレートへのカスタマイズ性が向上しました。本記事ではそのAddon及びオーバーライドの機能について解説します。

mirage-ecsで各メンバー専用開発サーバーを実現!まちのコインの運用事例を紹介します

開発用のサーバー環境の不足に悩まされたことはありませんか? サッと専用のサーバー環境をセットアップできるツール "mrage-ecs" の初回と、まちのコイン開発チームでの活用例を紹介します。

RedshiftのMERGE SQL commandがGAになりましたね。

RedshiftのMERGE SQL commandがGAになったので、趣味人が分厚く語りたいと思います。

Amazon ECSのタスクを常に新鮮に保つ仕組みをStep Functionsで

AWS Fargateのタスクが時々再起動する必要があることと、自動化による管理の簡素化について解説。定期的にタスクを入れ換えることで、管理上の問題を解決することができます。具体的には、Step FunctionsのAWS SDK統合を使用してシンプルなstate machineを実…

3/9(木) Google Cloud 主催 Innovators Live Japan に市川が登壇します!

sre

SREチーム(新卒)の市川恭佑です。Google Cloud が主催するオンライン形式のイベント Innovators Live Japan につきまして、この度、3月9日(木)開催のウェビナー「実録!SRE」の1コーナーを担当することになりました。

【解説編】CircleCIからOIDCを用いて安全にGoogle Cloudにアクセスする

sre

SREチーム(新卒)の市川恭佑です。これはカヤックSRE連載の2月号です。CircleCIからGoogle CloudにOIDCでアクセスする方法について、 前回ソースコードを紹介しましたが、今回はこれを深掘りして解説します。

【実践編】CircleCIからOIDCを用いて安全にGoogle Cloudにアクセスする

sre

SREチーム(新卒)の市川恭佑です。これはカヤックSRE連載の1月号です。 みなさんの記憶に新しいと思いますが、先日CircleCIで大きなセキュリティインシデントがありました1。 このインシデントを受けて、環境変数やContextに保存された外部サービスへの認証情…

SRE連載が始まります!

sre

あけましておめでとうございます。SREチーム(新卒)の市川恭佑です。 カヤック技術ブログでは本記事が2023年初エントリですが、Happy Lunar New Year!の方が違和感のない時期になってしまいました。 本年、新たにカヤックSRE連載と題した企画を始めるので、概…

【primeNumber×カヤック】オフライン勉強会を開催しました!

SREチーム(新卒)の市川恭佑です。 2022年12月19日にprimeNumberさんとカヤックのエンジニアで合同勉強会を開催しました。 primeNumberさんとは去年の5月に開催された勉強会でご一緒しましたが、その際はオンライン形式だったのでオフラインでの開催は初めて…